Taller de Investigación IV
Text Mining
Para las Cs. Sociales
📑 Introducirlos en el análisis de datos no estructurados
🕵️♀️ Metodología cualitativa + Análisis Estadístico
💻 Procesamiento de lenguaje Natural
Teorico
Práctico
Dos entregas obligatorias:
Es el proceso de analizar colecciones de materiales textuales con el fin de capturar conceptos y temas clave y descubrir relaciones y tendencias ocultas
Tokenización: División de texto en palabras o frases clave.
Lemmatización y stemming: Reducción de palabras a su forma base.
Representación vectorial: Bag of Words (BoW), TF-IDF, embeddings.